均值
Mean 平均值;中心位置
一、基本定义
均值是描述一组数或一个随机变量中心位置的量。根据对象不同,均值至少有两种常见含义:
- 样本均值:对已经观察到的数据求算术平均。
- 概率均值:对随机变量的可能取值按概率加权,也就是期望。
二者都刻画“中心”,但前者来自实际样本,后者来自概率模型。
二、样本均值
给定
例如五个新生年龄为
样本均值只说明这一次样本实际呈现的平均水平。换一组样本,即使总体概率规律不变,样本均值也可能变化。
三、概率均值与期望
若随机变量
例如新生年龄为
这与上一节的
连续随机变量用概率密度
四、大数定律
如果样本来自同一概率模型,并满足相应独立或弱依赖条件,样本均值会随着样本量增加而趋近期望。公平硬币中令正面为
需要注意的是,长期趋近不等于短期补偿。若投掷相互独立,前面连续出现多次反面,并不会提高下一次正面的概率;下一次正面的概率仍是
五、与方差和标准差
均值给出中心位置,方差衡量取值离中心的平方距离平均,标准差是方差的平方根。样本方差围绕样本均值计算,概率方差围绕期望计算:
当所有取值都等于同一个常数时,均值等于该常数,方差和标准差都为
六、边界条件
- 样本均值需要明确样本范围;加入或删除观测值会改变结果。
- 概率均值需要概率非负且总和为
;无限离散或连续情形还需要相应求和或积分收敛。 - 大数定律描述大量样本下的收敛趋势,不保证小样本已经接近期望。
- 独立重复试验没有“欠账补偿”;过去结果不会自动改变下一次试验概率。